一、背景知识#
1. 数列递推公式及通项公式#
在数学中,数列是一个有序的数字集合,通常表示为 $a_1, a_2, a_3, \ldots$。数列可以由递推公式定义,例如 $a_{n+1} = pa_n + q^n$。递推公式给出了数列中相邻项之间的关系。通项公式则是数列中任意项的直接表达式,形式通常为 $a_n$。
2. 对矩阵的初步认识#
矩阵是一种表格形式的数据结构,常用于表示线性变换。矩阵的基本运算包括加法、标量乘法和矩阵乘法。矩阵的加法是将两个同尺寸的矩阵对应位置的元素相加;标量乘法是将矩阵中的每个元素乘以同一个标量;矩阵乘法是将两个矩阵相乘,得到一个新的矩阵。对于数列问题,我们可以将系数转换为矩阵,并通过矩阵乘法来简化递推关系,进而求解通项公式。
二、引入问题#
假设我们有一个数列,其递推公式为 $a_{n+1} = pa_n + q^n$,初始条件为 $a_1$。我们要求出数列的通项公式。
常规方法#
我们采用待定系数法求解:
给定递推关系 $a_{n+1} = pa_n + q^n$
我们的目标是找到一个形式 $a_n + xq^{n+1} = p (a_n + xq^n)$,这样就可以通过比较两边的形式来确定 $x$,进而找到数列的通项公式。
首先,我们把原递推式改写为 $a_{n+1} + xq^{n+1} = pa_n + q^n + xq^{n+1}$
然后,我们希望左边的形式与右边的形式匹配,即 $a_{n+1} + xq^{n+1} = p (a_n + xq^n)$
这意味着 $pa_n + q^n + xq^{n+1} = pa_n + pxq^n$
通过对比两边的项,我们可以得出 $q^n + xq^{n+1} = pxq^n$
$q^n(1 + xq) = pxq^n$
从而得到 $1 + xq = px$
$1 = px - xq$
$1 = x(p - q)$
$x = \frac{1}{p - q}$
所以,如果我们找到了这样的 $x$,那么就可以构造新的数列 $b_n = a_n + xq^n$,该数列将满足一个更简单的递推关系 $b_{n+1} = pb_n$。
最后,我们可以求解新的数列 $b_n$ 的通项公式,再通过 $a_n = b_n - xq^n$ 求得原数列 $a_n$ 的通项公式。
具体地,我们有 $b_n = a_n + \frac {q^n}{p-q}$
因为 $b_{n+1} = pb_n$,这是一个等比数列,其通项公式为 $b_n = b_1 \cdot p^{n-1}$
其中 $b_1 = a_1 + \frac {q}{p-q}$
因此 $b_n = (a_1 + \frac {q}{p-q}) \cdot p^{n-1}$
所以 $a_n = (a_1 + \frac {q}{p-q}) \cdot p^{n-1} - \frac {q^n}{p-q}$
这就是数列 $a_n$ 的通项公式 $a_n = (a_1 + \frac {q}{p-q}) \cdot p^{n-1} - \frac {q^n}{p-q}$
三、引发思考#
在求解过程中,我们始终变换的是系数。这种变换是否与某种数学工具有关呢?
实际上,复数和向量的线性运算也有类似的性质。例如,复数可以表示为二维向量,而向量的加法和标量乘法等操作都可以通过矩阵来表示。
复数与向量的线性运算#
复数可以看作二维向量的一个特例,其中实部对应向量的 x 分量,虚部对应 y 分量。复数的加法和乘法运算类似于向量空间中的线性组合。
向量空间中的线性运算包括向量的加法、标量乘法以及向量的线性组合。这些运算可以使用矩阵来表示,矩阵乘法提供了实现这些变换的方法。
示例#
假设我们有两个复数 $z_1 = a + bi$ 和 $z_2 = c + di$,其中 $a, b, c, d$ 都是实数。
加法#
复数的加法可以表示为 $z_1 + z_2 = (a + bi) + (c + di) = (a + c) + (b + d) i$
我们可以通过矩阵来表示这个操作 $\begin {pmatrix} a & b \ -b & a \end {pmatrix} + \begin {pmatrix} c & d \ -d & c \end {pmatrix} = \begin {pmatrix} a+c & b+d \ -(b+d) & a+c \end {pmatrix}$
减法#
复数的减法可以表示为 $z_1 - z_2 = (a + bi) - (c + di) = (a - c) + (b - d) i$
同样地,我们可以用矩阵来表示 $\begin {pmatrix} a & b \ -b & a \end {pmatrix} - \begin {pmatrix} c & d \ -d & c \end {pmatrix} = \begin {pmatrix} a-c & b-d \ -(b-d) & a-c \end {pmatrix}$
四、用矩阵解决最开始的问题#
我们再次使用矩阵的方法来解决最初的问题:
定义状态向量 $\mathbf {s}n = \begin {pmatrix} a_n \ q^n \end {pmatrix}$,构造矩阵 $A = \begin {pmatrix} p & 1 \ 0 & q \end {pmatrix}$,使得 $\mathbf {s}{n+1} = A \mathbf{s}_n$
计算矩阵的幂次 $A^{n-1}$
$A^{n-1} = \begin{pmatrix} p & 1 \ 0 & q \end{pmatrix}^{n-1}$
由于 $A$ 是一个上三角矩阵,其幂次仍然是上三角矩阵,且对角元素分别为 $p$ 和 $q$ 的幂次 $A^{n-1} = \begin {pmatrix} p^{n-1} & * \ 0 & q^{n-1} \end {pmatrix}$
为了找出右上角的元素,我们可以使用数学归纳法 $A^2 = \begin {pmatrix} p^2 & p + q \ 0 & q^2 \end {pmatrix}$
$A^3 = \begin{pmatrix} p^3 & p^2 + pq + q \ 0 & q^3 \end{pmatrix}$
一般地,$A^{n-1} = \begin {pmatrix} p^{n-1} & \sum_{k=0}^{n-2} p^kq^{n-2-k} \ 0 & q^{n-1} \end {pmatrix}$
最终 $\mathbf {s}_n = A^{n-1} \mathbf {s}_1$
通过计算 $\mathbf {s}_n$,我们可以得到 $a_n$ 的表达式。
这样,矩阵方法为求解递推数列提供了一种新的视角。
此文由 Mix Space 同步更新至 xLog
原始链接为 https://blog.qwq.my/posts/math/reflections-on-the-method-of-undetermined-coefficients-for-finding-general-term-formulas